|
Im Bereich Business Intelligence werden verschiedenste Methoden und
Werkzeuge eingesetzt, um unternehmensweite Datenbestände in einem
Data Warehouse zu analysieren. Wichtige Vertreter sind hier das
Online Analytical Processing (OLAP) und das Data Mining. In der
praktischen Anwendung sind meist sowohl Werkzeuge aus dem
OLAP-Bereich als auch aus dem Data-Mining-Bereich notwendig, um im
Data Warehouse eines Unternehmens alle relevanten Informationen
aufzufinden.
Diese Arbeit befasst sich daher mit der Frage, wie Daten in einem
Data Warehouse strukturiert sein sollten, um den Einsatz von
Werkzeugen aus den Bereichen OLAP und Data Mining gleichermaßen zu
unterstützen.
Hierzu werden zunächst verschiedene Modellierungsalternativen aus
dem OLAP-Bereich betrachtet. Anschließend wird untersucht, welche
Anforderungen die verschiedenen Data-Mining-Methoden und
-Algorithmen an die Datenmodellierung stellen. Zusätzlich werden
einige ausgewählte Software-Werkzeuge betrachtet, wobei die
Datenimport- und Vorverarbeitungsmöglichkeiten im Vordergrund
stehen, da sie letztlich die Anforderungen an die Datenmodellierung
festlegen. Danach wird ein Klassifizierungsschema für
Data-Mining-Fragestellungen entworfen. Die zu den einzelnen Klassen
gehörenden Zahlen von Join-Operationen werden für die
verschiedenen OLAP-Datenmodelle ermittelt und zur Bewertung bzw. zum
Vergleich der Vorverarbeitungskomplexität der verschiedenen
OLAP-Datenmodellen verwendet. In diesem Zusammenhang werden auch
einige Optimierungsmöglichkeiten besprochen und das
Klassifizierungsschema auf eine Menge von Beispiel-Fragestellungen
angewandt. Abschließend wird eine Liste von Empfehlungen zur
Datenmodellierung von Data Warehouses für die Anwendung von OLAP-
und Data-Mining-Werkzeugen erstellt, die das Ergebnis dieser Arbeit
darstellt.
|